English

信息时代的知识英雄

2000-05-10 来源:中华读书报 本报实习记者 陈玲 我有话说

当雅虎、搜狐、找到啦等搜索引擎在互联网上炙手可热的时候,“数字图书馆”显得有些阳春白雪、曲高和寡。事实上,后者的专业化文献信息服务是前者所无法代替的。也许眼下的数字图书馆与读者还有些隔阂,但用不了多久,数字图书馆会成为信息时代的知识英雄。国内的几家图书馆已经开始向这个目标迈进了……

上网图书馆的尴尬:中看不中用

作为一个在清华校园里沉浸多年的学者,曹维对图书馆再熟悉不过了:从本科生、硕士生、博士生到教师,他的学习和科研的每一步都离不开图书馆。然而当记者在一间僻静的筒子楼房间里见到曹维时,他似乎对记者的问题有一点茫然——

“数字图书馆?就是上网图书馆吧?是不是图书馆上了互联网就是数字图书馆呢?”曹维迅速地在键盘上键入www.nlc.gov.cn的字样,大名鼎鼎的国家图书馆(原北京图书馆)首页出现在电脑屏幕上。

“如果这就是数字图书馆的话,那这样的图书馆可是多极了。不过么——”曹维简单地评价道:“中看不中用。”

“中看不中用”这几个字的评价对上网图书馆来说是意味深长的。目前中关村地区的几座著名的图书馆,如国家图书馆、北大图书馆、清华图书馆、中科院情报中心等,都已经跨过了办公系统自动化、业务管理自动化的阶段,开始向信息数字化、服务网络化的数字图书馆迈进。举例来说,清华大学的任何一名教师和学生,可以方便地在网上查询图书、文献资料的馆藏情况,例如所需图书在哪个阅览室,图书在架上、在编目中、还是已出借,何时归还、可否预约等。值得一提的是,这几个图书馆已经实现联合编目和有限的馆际互借,只要读者具备足够的耐心,就可以通过本单位图书馆的“馆际互借”办公室借到其他馆的图书。事实上,这几个图书馆还连接着全球最庞大的图书馆信息服务网络:OCLC。如果您不仅有耐心,而且还有充足的财力的话,还可以向国外两万余家图书馆索要文献复印件,大约每篇论文的价格在30美元左右。

图书馆的网络化管理给读者带来很大的方便,但是要想足不出户就得到相关的图书或文献就不容易了。因为充其量读者只能在网上浏览目录或检索文献,“看看而已”,而不能拿来就用。这与真正的数字图书馆还有很大的差距。

什么是真正的数字图书馆?

法国国立图书馆馆长曾经著文说,要是有一座图书馆能够宣布拥有世界上所有的图书,那可真是太幸福了。个人的或世界性的问题都不存在了,有效的解决办法就在那儿。这个想象中的图书馆——图书馆在其书库里藏有所有的书——是昨天的想法。今天,和把所有的书集中到一家图书馆的做法相反,世界上所有的图书馆,通过其藏品的数字化,进行扩张和伸展,组成数字图书馆。数字图书馆(digitallibrary),简单地说,就是利用网络基础设施提供各种数字化的信息(如文本、声音、图像、视频)的图书馆。

在这个“数字化生存”的时代,任何概念前面加上“数字”两字似乎都是时髦的。同样的,以下林林总总的称谓你或许也听到过:“电子图书馆”(electronicli?brary)、“虚拟图书馆”(virtuallibrary)、“无墙图书馆”(librarywithoutwalls)、“全球图书馆”(globallibrary)等。尽管名称不同,但指的都是不依赖于某一具体的图书馆实体,而是由许多数字图书馆和信息中心、情报处联网构成的信息空间。其独特之处在于对传统图书馆有形的物理边界的突破,而传统图书馆的物理边界则是由图书馆的藏书资源、服务资源、馆舍建筑所构成的有形空间。

不过,在笔者看来,无论是传统图书馆还是数字图书馆,其本质就是提供服务以满足人类社会信息交流的需要。图书馆的精髓在于“服务”。著名图书馆学家谢拉就曾对这种情况作过如下描述:“图书的集合并不等于图书馆,图书馆也不仅仅是一个保存图书的地方……它是一种社会工具。”数字图书馆不同于“雅虎”、“搜狐”,也就在于其信息服务的深度和专业化。通常的网络搜索工具只是搜索各个网页的前几行字,而对网页的主题、内容、类型等等只有很模糊的判断能力,因而搜索结果产生大量冗余、无关和重复的信息就不足为奇了。而图书馆的检索工具则从专业数据库入口,搜索文献的摘要、主题词等信息,因而检索结果的相关程度和专业深度就有了保障。这与人们查阅目录卡片、文献索引是一样的道理。所以说,数字图书馆信息的载体“不见了”、获取信息的方式不同了,都不是根本性的变化,但如果人们发现信息无处不在而信息服务却无处可觅的时候,大概就是该悼亡图书馆的时候了。

国外数字图书馆发展动态

国外的数字图书馆启动于90年代初,但发展极为神速。1994年9月,美国国家科学基金会、国家宇航局和国防部高级研究署正式决定投资2440万美元,在斯坦福大学等6所大学进行名为“数字图书馆创始”(DigitalLibraryInitiative)计划的研究。1998年又启动了该项目的二期工程。美国国会图书馆也开始实施“美国记忆”(AmericanMemory)项目,投资1200万美元,准备至2000年其200周年馆庆时完成500万件历史馆藏的数字化转换。

在1998年美国政府的财政基金中,政府将1.364亿美元用于“图书馆与技术法案 项目。美国图书馆自动化商Ameritech公司在近几年内,为美国国会图书馆的数字图书馆项目提供200万美元的资金,各种建设项目则采取在全美招标的方式,争取在2000年以前将数百万条信息放到Internet上,实现免费访问。

据报道,美国迄今投入到数字图书馆研究的经费已经超过8亿美元;俄罗斯在其经济尚未全面恢复的情况下,政府计划从1999-2004年每年出资两亿卢布支持数字图书馆研究;日本不仅投入了15亿日元开发日文文献数据库,而且还以建设国会图书馆分馆——关西电子图书馆为契机,拟投入4亿美元,将其建设为亚洲文献中心。法国国家图书馆正在致力于图书数字化,目前国立图书馆拥有2.4亿页数字化藏书。特别值得注意的是,新加坡、中国台湾等地也投入巨资进行数字图书馆相关工作的开发,试图确立网上中文信息的中心地位,一场没有硝烟的网上文化战争已经开始了,虽无声无息,但却如火如荼。

政府和高校

唱主角的背后

几乎是不约而同,各国政府和高校在数字图书馆研究和建设的过程中都扮演了重要的角色。政府具有无可比拟的官方权威性和财政力量,高校立于科研和高等教育的前沿,两者的优势集中于数字图书馆。事实上,这也反映了数字图书馆超越传统图书馆的信息基础设施本质。在信息爆炸的知识经济时代,一国的信息基础设施完善与否、信息内容的广度和深度、信息的有效性和密集度等等,直接反映并决定了一国的文化影响力。难怪中国科学院计算所所长、国家“863”计划306战略组的首席专家高文教授这样评价数字图书馆:“中国数字图书馆不仅仅是数字化的图书馆,它应该是中华文化的传播媒体,是文化产品的网络商务平台,是国家数字资源组织、开发和利用的基础,是网络文化中心和网络文化的集散地。”

与国外数字图书馆的海量数据相比,华夏泱泱大国、千年文明在互联网上就显得极度孱弱。据统计,目前互联网的信息中,英文约占95%,法文占3%,2%是其他文种,中文信息只占千分之八。而在这千分之八的中文信息中,又有一半以上的社会、新闻、娱乐、商业信息,缺少知识的深度和文化的底蕴。中国的数字图书馆,到了非露面不可的时候了。

中国奋起直追

中国数字图书馆的研发始于90年代中期。科技部“863”项目组专门设立了“中国数字图书馆发展战略研究软课题”。上海图书馆、辽宁图书馆、清华大学图书馆、北京大学图书馆、上海交通大学图书馆、北京邮电大学图书馆等先后进行了数字图书馆工程的研发。国家图书馆的“中国数字图书馆工程”于1998年7月即报文化部批准立项。今年4月5日,文化部在国家图书馆主持召开“中国数字图书馆工程第一次联席会议”,标志着筹备多年的数字图书馆工程已经正式启动,进入实质性操作阶段。

据联席会议办公室主任周和平先生介绍,在数字图书馆工程筹备期间,国家图书馆已经开发出数字图书馆的试验演示系统,组建了文献资源数字化加工系统,并经国务院批准成立了中国数字图书馆有限责任公司。目前,国家图书馆的文献数字化中心年生产规模已达到5000-6000万页全文影像数据,在网上为读者提供1000G存储量的信息服务,1999年全年读者访问量已经超过1亿点击人数,数据流量超过2000G。中国数字图书馆有限责任公司于今年4月18日正式宣布成立,由国家图书馆及其所属公司共同投资控股。

据悉,筹建中的数字图书馆工程是一个跨地区、跨行业、跨部门,长期建设的宏大系统工程,“联席会议”即“中国数字图书馆工程建设管理中心”的第一次会议,就集结了中宣部、文化部、科技部、国家计委、财政部、信息产业部、北京市政府、中国科学院、中国社会科学院、清华大学、北京大学等21个成员单位,并且还设立了阵容强大的专家顾问委员会,他们中间有胡启恒、李国杰等资深院士,也有清华北大的学术英才。据文化部长孙家正介绍,数字图书馆工程是国家信息基础设施(NII)的重要组成部分,它的建立将迅速扭转中文信息在网上匮乏的现状,使延续了五千年的华夏文明在网上占据优势。

中关村似乎在数字化浪潮中具有得天独厚的优势,国家图书馆、中国科学院文献情报中心、中国科学院网络中心科学数据库、北京大学图书馆、清华大学图书馆、国防大学图书馆等均荟萃于中关村。据北京市政府信息化办公室的消息,“中关村数字图书馆群”已被确定为中关村科技园区信息化建设总体目标中七个应用子系统之一,前期的调研工作业已收尾。相信很快就可以进入建设阶段。

初具雏形

现在互联网上已经可以找到属于中国自己的数字图书馆雏形。1998年7月,国家图书馆(http://www.nlc.gov.cn)与超星公司合作,在其首页上设“网上读书”栏目,将文史哲、计算机类等约100万页的电子图书提供给读者阅览,成为名副其实的“数字图书馆”。读者只要从其主页下载一个名为ssreader.exe的专用浏览器即可。历史图书馆的近1万册图书也可以用该浏览器阅读。读者可以在网络终端打印电子图书,但下载版权作品是不允许的。上海图书馆(http://www.libnet.sh.cn)将其馆藏中最具有特色的古籍善本搬上了互联网。以往人们要戴手套、口罩才能一睹真容的古籍,现在上网就可以随意翻看,原汁原味的中华文化精髓垂手可得。清华大学图书馆(http://www.lib.tsinghua.edu.cn)是国内网络服务最齐全的图书馆之一,同国内外联机数据库近600个,联机查询项目有:联机光盘数据库查询、EI(工程索引)服务、Sci?enceMagazine(《科学》杂志)检索服务、学位论文信息查询、电子期刊和电子会议等,而且大多是免费的。

此外,可以称得上数字图书馆的网站还有:博库网(www.bookoo.com.cn)、瑞得在线图书馆等。此外,网上还有些图书网站,如人民时空(www.peoplespace.net.cn),该网站是一个网络出版、网上图书、电子出版物和音像制品的综合性平台。有兴趣的读者不妨上网一试。

不过,中国的数字图书馆还只是个雏形。由于大部分图书页面都是扫描输入的,不免存在一些显示效果差、数据量大(从而传输速度慢)的缺点。另外读者想保存资料也十分不便。国外的数字图书馆通常会给读者多种选择,如保存到磁盘中、发送电子邮件、自定义文件类型等等,而国内的数字图书馆一般只提供打印输出,这对于那些习惯在电脑上工作的人来说不能不是一种遗憾。

除了互联网方面的扩展外,中国数字图书馆也在探索有线电视网上的信息服务空间。也许这正是数字图书馆走出“象牙塔”、深入寻常百姓家的一条新路。去年10月9日,国家图书馆与广电总局信息网络中心合作开展的“数字图书馆网络阅览室”项目正式通过了鉴定。第一家数字图书馆网络阅览室将建在山东省广播电视厅院内。国家图书馆丰富的信息资源通过广电总局遍布全国的有线电视网进入千家万户,成为国人共享的财富。而如何实现“以文养文”,也是文化部门正在考虑的一个问题。

谁是第一批使用者?

在网络信息技术膨胀、每天都有大量新网站诞生的今天,数字图书馆显得有些阳春白雪、曲高和寡。在熙熙攘攘的白颐路上,一辆辆公共汽车的车身上醒目地打着“搜狐”的广告,日日夜夜在国图门口来来往往。绝大部分人都能轻而易举地数落出几个著名的搜索引擎来,然而数字图书馆更为专业化的网络信息服务却鲜为人知。这到底是怎么回事?

记者在国家图书馆的电子阅览室里注意到,前来查阅互联网信息或数据库资料的人大多是附近的高校或科研机构的研究人员,年龄在二三十岁之间的居多。一位读者对记者说,这里的收费比较昂贵,如果不是公费报销,他是不会来的。这里的机时费为每小时5~10元,查询费为每条数据库信息10元,打印费为每页1~15元,拷贝费为每千字节0.2元。按照这种收费标准,获得一篇五千字左右的论文要花费机时费、查询费、拷贝费共约20元。记者了解到,如果自己在家或在单位上网的话,总的花费就会少得多,但有用的信息也就少得多了,因为国内的数据库习惯用password把门,而国外的数据库则会在你找到所需信息后向你询问信用卡号。

数字图书馆既然委身互联网,自然是深得互联网之自由(free,又意“免费”)、开放(open)之精髓的,然而在网络上读者磕磕碰碰、图书馆羞羞答答,究竟是什么原因?且看读者和图书馆分头道来。

读者:“等”你没商量

以下是笔者的一次亲身经历,相信教育网的用户会“心有戚戚焉”。

为了了解国家图书版网站上的数字化图书使用情况,我已经是第n次down它的专用浏览器ssreader.exe了。其实这个浏览器挺“迷你”,大约不到1MB大小,但是每次都down到一半时就因“操作超时”而被迫“取消”。据说是因为教育网出口比较窄的缘故。情急之下我只好跑到清华图书馆的多功能阅览室(内有数十台联网的计算机),欣喜地找到了工作人员备好在桌面上的ssread?er.exe,点击之下就到了“超星”数字图书馆,里面果然书目繁多,还有不少是刚出版的新书。谁都知道现在的新书身价不菲,在网上看到它真让我狂喜不已。我看上了一本名为《中国1999年经济形势和政策》的书,双击之后,漫长的考验就开始了。

等待……

等待……

等待……

五分钟后,一页粗黑体的书名醒目地显示在屏幕上。我松了一口气,信手翻到下一页。没想到浏览器又在重新搜索服务器、建立联系、更新页面。页面是逐行显示的,看来“分成传输”的技术还没有应用上。像我这种喜欢一目十行的急性子不得不调整一下自己的阅读习惯。看来这是目录页,我不想再等下去了,于是就随机键入一个数字:翻到56页。1分钟后系统显示:此页无效!

就这样强耐住性子看了将近1小时的书,除了令人心焦的等待以外,不期而至的“此页无效”、“连接中断”也令人大为光火。我终于决定关掉浏览器,回到清华主页,在“联机目录检索”中查到这本书在“新书阅览室”,现在的馆藏状态是“在架上”,还有体贴入微的书号可以引导我找到它。我飞奔下楼,几分钟后,从书架上抽出挺括的新书,手里和心里都觉得实实在在的,惬意的不得了。看来,数字图书馆固然是没有围墙和门槛,可是也“可望不可及”呀!

而公众网的用户自然要幸运些,笔者用拨号上网的方式试过,到国家图书馆“网上读书”的速度提高了数倍,但是如果想去教育网内的诸多高校图书馆转一转的话,就一定没有那么愉快了。

图书馆:有口难言

其实网络拥堵也不能完全怪罪数字图书馆,国内的信息高速公路建设滞后于需求是明摆着的事情。但是在带宽小、传输率低的情况下,电子图书自身体积庞大、行动不便就有点火上浇油的味道。眼下数字图书馆绝大部分图书是按页保存的图形文件,没有经过OCR识别,要比同样内容的纯文本文件至少大几十倍。难怪有些读者把WorldWideWeb戏称为WorldWideWait呢。而文件量大、传输慢,自然就抬高了网费和电话费。据统计,在中国要比在美国以高出200倍价格买回同样的信息,故普通读者难以负担。

另外,现在的各个数字图书馆还没有统一的检索端口和阅读平台,令读者颇有微词。国内的数字图书馆各有各的面孔,如国家图书馆使用“超星”的ss?reader.exe浏览器、上海数字图书馆自行研究开发出一套“中国古籍善本查阅系统”、辽宁图书馆采用IBM的数字图书馆完整解决方案等,这给读者的检索造成了一定的不便。不难理解,数字图书馆是一个开放的系统,包括大量的异构数据库和服务器,不是单独一个图书馆就可以完成的,因而需要各馆之间的横向联合和统一标准,如书目格式、元数据等,这样才可以为读者提供信息资源共享的统一平台。然而,数字图书馆的建设却沿袭了传统图书馆的板块建制,各地方和行业各自为政、自给自足。有的专家认为这是中国数字图书馆发展的必经阶段,即各个图书馆首先完成各自的馆藏数字化,然后进一步联网成一个更大更全面的数字图书馆群。但是这种观点恐怕没有充分地考虑到统一规划的重要性,而为日后的统一平台设置了许多技术障碍。

版权: 想说爱你不容易

数字图书馆在版权上碰了个不大不小的钉子。

图书馆作为公益性文化事业,其馆藏图书最大限度地被使用是它的宗旨,数字化技术令图书馆的服务突破了物理和时空的局限性,实在是件大快人心的好事。然而文献的传播和复制成为轻而易举的事情,也令图书馆担心卷入版权纠纷。就连底气十足的国家图书馆也在其“网上读书”的首页小心翼翼的表示:“如有版权争议,请及时通知本馆,本馆将尽快从页面上删除。”

事实上,版权作品的数字化在法律上是什么性质,目前尚无定论。学术界有两种不同观点:一种认为数字化是对原作品的演绎,类似于翻译作品;另一种则认为数字化是对原作品的复制,理由是数字化过程并没有创造新的作品,现在国际上的立法倾向于后者,即认为数字化是一种复制行为。演绎和复制是著作权的重要组成部分,尤其复制权是著作权的核心。但是什么样的复制行为构成侵权呢?一个通行的国际标准是“合理使用”。按照我国的著作权法第22条规定,以下情况属于合理使用的范围:(1)图书馆为了保存或存档而进行复制;(2)图书馆为读者学习、研究或欣赏的目的提供复制;(3)为读者进行课堂教学或评论之目的提供复制;(4)国家为执行公务需要,要求图书馆提供某些作品的复制。

还有些因素也被纳入考虑的范围,譬如说复制文献使用的目的和性质,包括这种文献是否有商业性质或盈利性目的;又如复制文献的数量及其对版权作品的潜在市场或价值产生的影响。由于图书馆控制读者对数字化文献的使用是十分困难的,所以后者而非前者往往成为争论的焦点。

以上版权法是基于图书印刷复制的有限性,即复制的成本高,因而版权保护容易实现。而对于数字化作品,低成本、无限量的复制成为可能,因此许多国际出版商认为不能适用传统的版权法。“使用未经授权的数字化文献将毁灭版权作品的价值。”

由于这方面的立法还不十分明朗,目前国内的图书馆在数字化馆藏资料时,通常首选那些属于公共领域的古籍善本和各种历史文献、档案资料。而对于版权作品则较少问津,偶尔收录也会在技术处理上十分谨慎,例如采用特殊的文件类型、屏蔽下载和拷贝选项等。于是就形成一个奇怪的现象:网络新贵钟情于历史古董,有文章称之为“中国古籍的数字化生存”。数字图书馆在其馆藏内容上不得不与日新月异的信息爆炸时代拉开了距离。

尽管中国的数字图书馆在资源积累、服务方式、基础设施、图书馆立法(包括版权问题)等方面还有挺长的路要走,但是在这个高速生长的网络上,什么奇迹不会发生呢?也许就在今天,某个数字图书馆令你眼前一亮,于是你就再也离不开它了。

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有